…

Objetivo del curso

Este curso tiene como objetivo introducir a los estudiantes en las herramientas fundamentales para extraer información valiosa de datos sin procesar, a menudo generados fuera de los diseños de investigación científica tradicionales. Específicamente, el curso busca establecer una base sólida en el dominio de las herramientas esenciales para la Ciencia de Datos, utilizando R y Tidyverse, un conjunto de paquetes de software estadístico de código abierto ampliamente reconocido en la investigación académica y aplicada.

Contenido del programa

El programa abarca cada etapa del proceso de manipulación y análisis de datos, incluyendo:

  1. Importación de datos
  2. Limpieza y validación
  3. Transformación
  4. Visualización
  5. Modelado
  6. Creación de informes automáticos y reproducibles

Acá pueden visualizar el programa del curso

Al finalizar el curso, los estudiantes serán capaces de analizar bases de datos de complejidad intermedia a avanzada, aplicando un enfoque sistemático y riguroso en cada fase del proceso analítico.

Bibliografía fundamental

El curso se basa principalmente en los siguientes libros:

  1. Wickham, H., Çetinkaya-Rundel, M., & Grolemund, G. (2023). R for data science. O’Reilly Media, Inc.  Versión en inglés disponible en línea

  2. Llaudet, E., & Imai, K. Data Analysis for Social Science: A Friendly and Practical Introduction. Princeton University Press.

Estos textos proporcionan tanto los fundamentos teóricos como las aplicaciones prácticas de la Ciencia de Datos, con un enfoque particular en el uso de R y Tidyverse para el análisis de datos en ciencias sociales.